首页> 外文OA文献 >Bayesian Optimal Control of Smoothly Parameterized Systems: The Lazy Posterior Sampling Algorithm
【2h】

Bayesian Optimal Control of Smoothly Parameterized Systems: The Lazy Posterior Sampling Algorithm

机译:平滑参数化系统的贝叶斯最优控制:懒惰   后验抽样算法

摘要

We study Bayesian optimal control of a general class of smoothlyparameterized Markov decision problems. Since computing the optimal control iscomputationally expensive, we design an algorithm that trades off performancefor computational efficiency. The algorithm is a lazy posterior sampling methodthat maintains a distribution over the unknown parameter. The algorithm changesits policy only when the variance of the distribution is reduced sufficiently.Importantly, we analyze the algorithm and show the precise nature of theperformance vs. computation tradeoff. Finally, we show the effectiveness of themethod on a web server control application.
机译:我们研究一类光滑参数化马尔可夫决策问题的贝叶斯最优控制。由于计算最佳控制在计算上是昂贵的,因此我们设计了一种在性能与计算效率之间进行权衡的算法。该算法是一种惰性后验采样方法,可以在未知参数上保持分布。仅当分布的方差充分减小时,算法才会改变其策略。重要的是,我们分析了算法,并显示了性能与计算权衡的精确性质。最后,我们展示了该方法在Web服务器控件应用程序上的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号